大模型本地部署,小号的vLLM来了
• 一方面,像vllm、ollama、ragflow、llama.cpp和huggingface/transformers这样的项目占据主导地位,这表明贡献者正在投资 AI 的基础层——模型运行时、推理引擎和编排框架。• 另一方面,像vscode、godot、
• 一方面,像vllm、ollama、ragflow、llama.cpp和huggingface/transformers这样的项目占据主导地位,这表明贡献者正在投资 AI 的基础层——模型运行时、推理引擎和编排框架。• 另一方面,像vscode、godot、
Agent 的出现,正在重塑我们对智能应用的理解。它不仅是技术的延伸,更是人与系统之间新的协作方式。本文以万字长文,系统拆解 Agent 的概念、能力与应用场景,帮助你在浪潮中看清本质。
市场不是机器,而是人群;不是公式,而是故事。TwinMarket让AI学会讲述这些故事。
智能体 风格化 llm bdi twinmarket 2025-11-18 14:41 1
就在刚刚,卸任亚马逊CEO三年的杰夫·贝索斯(Jeff Bezos)宣告“重出江湖”。他不仅豪掷巨资,启动了一家名为“普罗米修斯计划”(Project Prometheus)的神秘AI初创公司,更亲自出任联席CEO,
在号称「史上最严管控AI」的顶级会议ICLR 2026上,评审区却悄悄被大模型攻占。每五条审稿意见里,就有一条几乎全由AI一键生成。当作者怀疑评审是机器人写的、审稿人又怀疑论文是模型拼的,同行评审这台「科学秩序的发动机」,正一点点滑向一场没人承认、却无处不在的
大型语言模型(LLMs)开始在机械计算机辅助设计(CAD)工作流程中找到角色。通过解释自然语言或高层次的规范,LLMs(包括较小的微调模型,或“SLMs”)可以帮助工程师完成从生成参数化模型到编写制造说明的各种任务。但将语言模型整合到传统的CAD流程中是否真的
这几天好像这个叫 TOON 的东西比较火,我们这篇文章来看看他到底是什么,又有什么作用。TOON 全称 Token-Oriented Object Notation,它主要解决的问题就是当你把json 输入给LLM 的时候,token 消耗太高了。
亚马逊创始人杰夫・贝索斯正在将他的金钱与时间投入一家人工智能初创公司,并将以联合 CEO 的身份参与日常管理。
Anthropic 的 Alignment Science 团队发布最新研究,直指大语言模型训练过程的投毒攻击。实验涵盖了多种模型规模和数据集,发现仅需在预训练数据中加入 250 条恶意样本,就足以植入一个“后门”漏洞。Anthropic 得出的结论是,随着模
llm anthropic 投毒 研 anthropic研究 2025-11-16 10:32 1
放眼全球科技圈,AI无疑是最火的“炉灶”。巨头们砸钱几百亿几百亿地投,生怕掉队。
LLMAgent如今在网页浏览、软件开发、具身控制等领域的拓展速度,真的超出很多人预期。
做过RAG应用开发的技术同学,大多听过这样一句话:“RAG demo5分钟,上线上一年”。确实,用Langchain或LlamaIndex搭一个简单的检索增强生成流程并不复杂,但要让系统在实际业务中稳定输出高质量答案,却需要攻克分块优化、检索策略、上下文增强等
11月5日下午,“启真求是媒介圈”第20期讲座在浙江大学中西书屋举行。本期活动邀请上海交通大学媒体与传播学院特聘教授葛岩,以及上海交通大学文化创意产业学院助理研究员赵汗青作为主讲,讲座由我院教授张子柯主持,吸引了数十名师生积极参与。
做过独立开发的朋友都清楚,虽然现在 AI 已经能写出相当不错的前端,后端也有成熟的 BaaS 服务,但应用开发并不仅仅只是写份代码。
尽管 LangChain 主要提供 Python 和 JavaScript/TypeScript 版本,但也可以在 Java 中使用 LangChain。我们会讨论 LangChain 作为框架的构建模块,然后尝试在 Java 中进行实验。
在 2025 年第三季度,B站交出了一份稳健的成绩单:平均日活跃用户(DAU)达到约 1.173 亿人,同比增长约 9%。同期总净收入约为人民币 76.9 亿元(约合 US$1.08 十亿),同比增长约 5%。毛利润约为人民币 28.2 亿元,同比增长约 11
首先,我们先分享一个例子。这张图是我用一个我们基于内部孵化 Agentic Search(智能体搜索)的产品,把这两天 DACon 活动的信息做了一个自动的信息摘要(Summary)。 大概只花了 5 到 10 分钟,就获得了一个完整的分析摘要,包括相关的议题
具备通用人工智能的人形机器人距离真正进入我们的日常生活还有数年时间,但特定应用领域的机器人早已问世。从亚马逊物流中心的机器人车队,到手术室的外科手术机器人、搜救机器狗、自主无人机和最后一公里配送机器人,再到常见的扫地机器人,物理人工智能系统正变得越来越智能,也
AI 智能体是能够自主决策并采取行动以完成任务的系统。与聊天机器人不同,它们不遵循预定义的工作流程——它们会进行推理、规划、使用工具并动态适应。本指南将通过真实示例和代码,向你具体展示如何使用如 LangChain 和 AutoGen 等现代框架来构建可工作的
我们今天为大家带来的文章,作者的观点是:GPU 工程的核心不在于手写内核的能力,而在于构建系统设计思维 —— 理解从模型定义到硬件层的完整技术栈如何协同工作。作者提出了一个五层渐进式调试框架:从模型定义(Model Definition)入手,识别计算与内存瓶